Chỉ số shimmer là gì? Các nghiên cứu về Chỉ số shimmer

Chỉ số shimmer đo sự dao động nhỏ trong biên độ của sóng âm qua các chu kỳ kế tiếp, phản ánh mức độ ổn định cường độ giọng nói tự nhiên. Đây là chỉ số quan trọng trong phân tích âm thanh, giúp chẩn đoán rối loạn phát âm và đánh giá chất lượng tín hiệu giọng trong nghiên cứu y học và công nghệ.

Chỉ số Shimmer là gì?

Chỉ số Shimmer là một đại lượng được sử dụng trong phân tích âm thanh, đặc biệt trong lĩnh vực nghiên cứu và chẩn đoán các rối loạn về giọng nói. Nó đo lường sự thay đổi không ổn định trong biên độ (amplitude) của các chu kỳ sóng âm kế tiếp nhau. Các dao động nhỏ này, nếu vượt quá mức bình thường, có thể là dấu hiệu cho thấy các vấn đề ở cơ quan phát âm như dây thanh quản. Vì lý do đó, shimmer trở thành một trong những chỉ số sinh học giọng nói quan trọng nhất trong lĩnh vực y học giọng nói và khoa học âm thanh.

Sự biến thiên biên độ này thường quá nhỏ để có thể nhận thấy bằng tai thường, nhưng có thể được phát hiện chính xác thông qua phân tích tín hiệu số. Sự bất thường trong shimmer có thể liên quan đến các hiện tượng như mệt mỏi giọng, tổn thương dây thanh hoặc các rối loạn thần kinh ảnh hưởng đến sự điều khiển giọng nói.

Nguyên lý đo lường chỉ số Shimmer

Để đo shimmer, tín hiệu giọng nói được phân tách thành các chu kỳ cơ bản (fundamental cycles) dựa trên tần số cơ bản F0 F_0 . Sau đó, biên độ cực đại trong mỗi chu kỳ được xác định, và sự khác biệt giữa các chu kỳ liên tiếp được tính toán.

Công thức tính shimmer tương đối phổ biến nhất là:

Shimmer (%)=1N1i=1N1Ai+1AiAi×100 \text{Shimmer (\%)} = \frac{1}{N-1} \sum_{i=1}^{N-1} \left| \frac{A_{i+1} - A_i}{A_i} \right| \times 100

Trong đó:

  • Ai A_i : Biên độ cực đại của chu kỳ thứ i i .
  • N N : Tổng số chu kỳ phân tích.

Shimmer tuyệt đối (Absolute Shimmer) được tính theo công thức:

Shimmer (abs)=1N1i=1N1Ai+1Ai \text{Shimmer (abs)} = \frac{1}{N-1} \sum_{i=1}^{N-1} |A_{i+1} - A_i|

Giá trị shimmer càng cao chứng tỏ sự dao động về cường độ càng lớn, thể hiện sự thiếu ổn định trong quá trình tạo âm thanh.

Ý nghĩa lâm sàng và ứng dụng nghiên cứu

Chỉ số shimmer có ý nghĩa quan trọng trong:

  • Chẩn đoán y học: Phát hiện các tổn thương dây thanh, viêm dây thanh, bướu thanh quản, và các rối loạn thần kinh ảnh hưởng đến giọng nói.
  • Đánh giá hiệu quả điều trị: Theo dõi tiến trình phục hồi sau can thiệp điều trị hoặc phẫu thuật dây thanh.
  • Phân tích chuyên sâu về giọng nói: Nghiên cứu ảnh hưởng của stress, tuổi tác và giới tính đến độ ổn định giọng.

Nghiên cứu từ NCBI - Shimmer Analysis in Voice Disorders chỉ ra rằng người mắc các bệnh lý thanh quản có chỉ số shimmer cao hơn rõ rệt so với người bình thường.

Phương pháp và công nghệ đo shimmer

Để đo shimmer chính xác, các yếu tố sau cần được đảm bảo:

  • Thiết bị ghi âm chất lượng cao: Microphone độ nhạy cao, có đáp ứng tần số rộng và độ méo thấp.
  • Môi trường ghi âm: Phòng cách âm tiêu chuẩn, giảm thiểu tiếng ồn nền và cộng hưởng.
  • Phần mềm phân tích: Công cụ như Praat, VoiceSauce hoặc MATLAB với các gói xử lý tín hiệu.

Các bước cơ bản:

  1. Thu mẫu giọng nói với tần số lấy mẫu ít nhất 44.1 kHz.
  2. Chuẩn hóa biên độ tín hiệu để loại bỏ biến thiên không mong muốn.
  3. Xác định các chu kỳ cơ bản và đo biên độ từng chu kỳ.
  4. Tính shimmer theo công thức phù hợp.

Giá trị shimmer bình thường và các mức độ bất thường

Theo nghiên cứu tổng hợp trên ScienceDirect - Acoustic Measures of Voice, chỉ số shimmer bình thường:

  • Người khỏe mạnh: 0.2% đến 1.0% (relative shimmer).
  • Người có tổn thương nhẹ: 1.0% đến 3.0%.
  • Người mắc bệnh lý nặng: Trên 3.0%.

Cần lưu ý rằng giá trị shimmer có thể thay đổi theo độ tuổi (tăng theo tuổi) và giới tính (phụ nữ thường có shimmer cao hơn nam giới nhẹ).

So sánh shimmer với jitter

Trong phân tích giọng nói, shimmer thường được đánh giá song song với jitter. Trong khi shimmer đo biến thiên biên độ, thì jitter đo biến thiên tần số chu kỳ.

Cụ thể:

  • Jitter: Biến thiên ngẫu nhiên về độ dài chu kỳ sóng.
  • Shimmer: Biến thiên ngẫu nhiên về cường độ chu kỳ sóng.

Sự kết hợp của shimmer và jitter giúp tạo ra bức tranh đầy đủ hơn về sự ổn định và chất lượng của tín hiệu giọng nói.

Ứng dụng thực tiễn của chỉ số shimmer

Chỉ số shimmer ngày càng được ứng dụng rộng rãi trong các lĩnh vực:

  • Y học giọng nói: Phát hiện sớm và theo dõi rối loạn phát âm.
  • Đào tạo thanh nhạc: Phân tích chất lượng giọng hát, hỗ trợ cải thiện kỹ thuật phát âm.
  • Kỹ thuật nhận dạng giọng nói: Tăng độ chính xác của hệ thống khi phân biệt các trạng thái cảm xúc hoặc tình trạng sức khỏe người dùng.
  • Phân tích cảm xúc tự động: Dùng shimmer để nhận diện trạng thái cảm xúc từ giọng nói như căng thẳng, buồn bã, phấn khích.

Những thách thức trong việc phân tích shimmer

Phân tích shimmer vẫn còn gặp nhiều thách thức:

  • Độ nhạy cao với nhiễu tín hiệu và sai số đo đạc.
  • Sự phụ thuộc vào chất lượng thiết bị và môi trường ghi âm.
  • Ảnh hưởng bởi biến thể tự nhiên giữa các cá nhân và ngữ cảnh phát âm.

Vì vậy, để đảm bảo độ chính xác, các nghiên cứu thường yêu cầu chuẩn hóa quy trình thu thập và phân tích dữ liệu.

Kết luận

Chỉ số shimmer là một công cụ không thể thiếu trong phân tích chất lượng giọng nói, giúp đánh giá sự ổn định của biên độ và phát hiện sớm các bất thường về phát âm. Với sự phát triển của công nghệ và các kỹ thuật xử lý tín hiệu hiện đại, shimmer đang ngày càng đóng vai trò quan trọng trong y học, giáo dục âm nhạc và công nghệ nhận dạng giọng nói, mở ra nhiều cơ hội nghiên cứu và ứng dụng mới.

Các bài báo, nghiên cứu, công bố khoa học về chủ đề chỉ số shimmer:

ĐÁNH GIÁ SỰ THAY ĐỔI GIỌNG Ở BỆNH NHÂN VIÊM MŨI XOANG MẠN TÍNH CÓ POLIP ĐỘ III, IV TRƯỚC VÀ SAU PHẪU THUẬT NỘI SOI MŨI XOANG CẮT POLIP MŨI
Tạp chí Y học Việt Nam - Tập 505 Số 2 - 2021
Viêm mũi xoang mạn tính có polyp độ III – IV là một trong số những nguyên nhân ảnh hưởng tới kích thước hốc mũi, khe, hệ thống xoang, ảnh hưởng tới thông khí mũi, các cấu âm mũi và cộng hưởng . Để đánh giá mức độ ảnh hưởng tới chất lượng âm thanh và cấu âm ở những đổi tượng này, chúng tôi tiến hành nghiên cứu trên 30 bệnh nhân chẩn đoán viêm mũi xoang mạn tính, polip mũi độ III và IV...... hiện toàn bộ
#viêm mũi xoang mạn - polip mũi độ III #viêm mũi xoang mạn - polip mũi độ IV #chương trình PRAAT #chỉ số Shimmer #Jitter #HNR #các formants
NGHIÊN CỨU THAY ĐỔI GIỌNG NÓI Ở BỆNH NHÂN SAU CẮT AMIĐAN
Tạp chí Y học Việt Nam - Tập 502 Số 2 - 2021
Phẫu thuật cắt Amidan là một trong những loại phẫu thuật phổ biến nhất trong tai mũi họng, chiếm khoảng 2,3% -26,9% tổng số các ca phẫu thuật tai mũi họng. Việc cắt bỏ amiđan ít nhiều làm thay đổi kích thước khoang họng và tác động đến các giai đoạn hình thành giọng nói trong đó có bộ phận cấu âm và cộng hưởng. Trên thế giới, việc nghiên cứu về sự thay đổi giọng nói sau cắt amiđan mới bắt đầu được...... hiện toàn bộ
#sau cắt amiđan #chương trình PRATT #chỉ số Shimmer #Jitter #HNR #thanh điệu #các formants
ĐÁNH GIÁ RỐI LOẠN GIỌNG CỦA BỆNH NHÂN SAU CẮT THANH QUẢN BÁN PHẦN
Tạp chí Y học Việt Nam - Tập 504 Số 2 - 2021
Phẫu thuật cắt thanh quản bán phầnchiếm 31,2% tổng số các ca phẫu thuật ung thư thanh quản. Việc cắt bỏ một phần cấu trúc thanh quản sẽ làm thay đổi giọng. Chúng tôi tiến hành nghiên cứu “Đánh giá rối loạn giọng của bệnh nhân sau cắt thanh quản bán phần” trên 30 bệnh nhân được cắt thanh quản bán phần tại Bệnh viện Tai Mũi Họng trung ương, được phân tích giọng trước và sau cắt thanh quản bán phần b...... hiện toàn bộ
#Cắt thanh quản bán phần #chương trình PRATT #chỉ số Shimmer #Jitter #HNR #thanh điệu #tần số âm cơ bản #trường độ âm
Tổng số: 3   
  • 1